24 settembre 2018
Il dataset utilizzato "vgsales" é stato preso dal sito kaggle.com e rappresenta le vendite di videogiochi nel mondo, aggiornate al 26/10/2016.
## [1] 16598 11
## Rank Name Platform Year Genre Publisher ## 1 1 Wii Sports Wii 2006 Sports Nintendo ## 2 2 Super Mario Bros. NES 1985 Platform Nintendo ## 3 3 Mario Kart Wii Wii 2008 Racing Nintendo ## 4 4 Wii Sports Resort Wii 2009 Sports Nintendo ## 5 5 Pokemon Red/Pokemon Blue GB 1996 Role-Playing Nintendo ## 6 6 Tetris GB 1989 Puzzle Nintendo ## NA_Sales EU_Sales JP_Sales Other_Sales Global_Sales ## 1 41.49 29.02 3.77 8.46 82.74 ## 2 29.08 3.58 6.81 0.77 40.24 ## 3 15.85 12.88 3.79 3.31 35.82 ## 4 15.75 11.01 3.28 2.96 33.00 ## 5 11.27 8.89 10.22 1.00 31.37 ## 6 23.20 2.26 4.22 0.58 30.26
\(\Rightarrow\)
\(\textbf{Tidy data}\)
\(\rightarrow\) no operazioni tidyng
Controllo su:
eventuali valori mancanti \(\textit{NA}\) (not available)
impossibili (pdv logico).
Nella variabile di tipo factor troviamo:
- 271 \(\rightarrow \textit{N/A}\) - 3 \(\rightarrow \textit{2017}\) - 1 \(\rightarrow \textit{2020}\).
Elimiamo le tuple contenenti questi valori: sono \(\frac{271+3+1}{16598}\) corrispondenti all'\(1.65\%\) del totale.
Non essendo chiarissimo, selezioniamo solo le piattaforme con i maggiori ricavi, per ogni anno
In sintesi:
| 2600 | GB | NES | PS | PS2 | PS3 | PS4 | SNES | Wii | X360 |
|---|---|---|---|---|---|---|---|---|---|
| 3 | 1 | 6 | 6 | 5 | 3 | 5 | 5 | 4 | 1 |
Rendiamolo piú leggibile \(\Rightarrow\) selezioniamo i 5 generi piú venduti per zona geografica
\(\Rightarrow\) Plottiamo allora la serie storica degli istogrammi per ciascun genere di videogioco
istogrammi utili solo se le vendite di un certo genere superino di gran lunga le altre (es. nel 1985 e 1988) $$ grafico non efficace!
Confrontiamo, a partità di genere di videogiochi, i ricavi nel tempo:
Attraverso questo grafico interattivo, possiamo confrontare anno per anno i ricavi per ciascun genere di videogiochi.
Per mostrarlo utilizziamo il comando sqldf ed il consueto plot.ly:
Nel grafico è stata rimossa, per meri fini estetici, la legenda
I colori non denotato l'appartenenza ad un genere o ad una societá
potremmo aspettarci che a paritá di anno il gioco piú venduto dovrebbe 'girare' su un tipo di piattaforma che si colloca al primo posto, in quanto a ricavi, rispetto alle concorrenti. In effetti ció accade sovente in questi decenni, ma non sempre. Vediamo quando ció non avviene.
Per raggiungere lo scopo costruiremo dei sottografici di plot.ly, (riutilizziamo un grafico appena creato) e ricalcheremo il codice dell'ultimo grafico modificando unicamente il parametro \(\textit{fill}\) ponendolo uguale a '\(platform\)' così da colorare \(\textbf{tutte}\) le palline sulla base della loro piattaforma. Lo scopo di tutto ció é permettere un agevole confronto avendo ora un criterio di confronto coerente fra i 2 plot:
*Il grafico lo leggiamo in verticale: scelto un anno qualsiasi, se le 2 palline riferite a quell'anno presentano colori diversi, allora la piattaforma che ha performato meglio in termini di vendite non é la stessa che ha venduto il gioco piú 'gettonato' in quello stesso anno.
** Ad esempio: \(\textit{Super Mario Bros.} \;\) é stato il gioco piú venduto nel 1985 (40.24 mln di €) e 'girava' sulla piattaforma \(\textit{NES}\) (Nintendo Entertainment System). Ebbene la \(\textit{NES}\) risulta la Piattaforma piú popolare nel 1985, con un ricavo complessivo di 53.44 mln di euro.
** Ma: \(\textit{Pokemon Red/Pokemon Blue} \;\) é stato il gioco piú venduto nel 1996, ma girava su \(\text{GB}\) (GameBoy) e non sulla \(\text{PS}\) che risulta la piú popolare in quell'anno con un ricavo complessivo di 94.68 mln di euro. Lo stesso avviene anche nel 1998, 1999, e in altri anni ancora.
E' possibile verificare quanto affermato inserendo 1996 nel textbox e ordinare per Year e Ricavi ottenendo come gioco piú venduto Pokeon.
Infine inserendo 1996 nel textbox successivo notiamo che il PS é la piattaforma piú gettonata in quest’anno.
Scegliamo le migliori 10 per la richiesta che valga per ogni anno questo dominio, quindi complessivamente é ragionevole ritenere che le aziende in gioco avranno ricavi fra i piú elevati. Vediamo dunque come evolve nel tempo l'andamento dei ricavi delle 10 migliori aziende.
Per rispondere, osserviamo come evolvono i ricavi delle 10 aziende piú performanti (quelle di cui sopra), suddivisi per genere.
Per realizzare il grafico abbiamo rimosso la legenda così da vederlo piú nel dettaglio
la trasformazione logaritmica aiuta ad evidenziare meglio il fenomeno sull'asse delle ordinate
Le domande che ci siamo posti vertevano su diversi oggetti: piattaforme di gioco, di genere, incassi dei produttori per zona geografica e nel tempo, societá che realizzavano i piú alti guadagni. Non sono state riscontrate particolari anomalie o incoerenze logiche nei risultati ottenuti.
* Certamente l'analisi effettuata puó svilupparsi ulteriormente appronfondendo diversi aspetti come ad esempio: - scoprire quali sono i fattori piú importanti che determinano il volume delle vendite dei giochi
- paragonare i fatturati delle aziende per zona geografica nel tempo - oppure prevedere le vendite in un mercato conoscendo le vendite in altri mercati e così via
Con questo lavoro speriamo di aver incoriosito e stuzzicato il lettore un po' piú esperto a proseguire questa indagine.
"\(\textit{Non ho particolari talenti, sono soltanto appassionatamente curioso}\)"" - Albert Einstein